The findable, accessible, interoperable, and reusable (FAIR) data principles have provided a framework for examining, evaluating, and improving how we share data with the aim of facilitating scientific discovery. Efforts have been made to generalize these principles to research software and other digital products. Artificial intelligence (AI) models -- algorithms that have been trained on data rather than explicitly programmed -- are an important target for this because of the ever-increasing pace with which AI is transforming scientific and engineering domains. In this paper, we propose a practical definition of FAIR principles for AI models and create a FAIR AI project template that promotes adherence to these principles. We demonstrate how to implement these principles using a concrete example from experimental high energy physics: a graph neural network for identifying Higgs bosons decaying to bottom quarks. We study the robustness of these FAIR AI models and their portability across hardware architectures and software frameworks, and report new insights on the interpretability of AI predictions by studying the interplay between FAIR datasets and AI models. Enabled by publishing FAIR AI models, these studies pave the way toward reliable and automated AI-driven scientific discovery.
translated by 谷歌翻译
尽管从图像和视频数据中恢复几何形状在计算机视觉中受到了很多关注,但捕获给定几何形状纹理的方法不那么成熟。具体而言,纹理生成的经典方法通常假设干净的几何形状和合理的一致图像数据。尽管最近的方法,例如,对抗性纹理优化,更好地处理从手持设备获得的低质量数据,但我们发现它们仍然经常挣扎。为了提高鲁棒性,特别是最近的对抗性纹理优化,我们开发了明确的初始化和一个对齐程序。由于将几何形状绘制到纹理图和基于硬分配的初始化,因此它处理了复杂的几何形状。它通过将快速的图像对齐整合到纹理细化优化中来处理几何和图像的错位。我们在11个场景的数据集中证明了纹理生成的功效,总共有2807帧,观察7.8%和11.1%的感知和清晰度测量值相对改善。
translated by 谷歌翻译
未知视图断层扫描(UVT)从其2D投影以未知的随机取向重建了3D密度图。从Kam(Kam(1980))开始的工作线采用了具有旋转不变的傅立叶特征的矩(MOM)方法,可以在频域中求解UVT,假设方向是均匀分布的。这项工作系列包括基于矩阵分解的最新正交矩阵检索(OMR)方法,虽然优雅地需要有关无法可用的密度的侧面信息,或者无法充分强大。为了使OMR摆脱这些限制,我们建议通过要求它们相互一致来共同恢复密度图和正交矩阵。我们通过deno的参考投影和非负约束来使所得的非凸优化问题正常。这是通过空间自相关功能的新闭合表达式启用的。此外,我们设计了一个易于计算的初始密度图,可有效地降低重建问题的非凸性。实验结果表明,在典型的3D UVT的典型低SNR场景中,具有空间共识的拟议的OMR比以前最新的OMR方法更好。
translated by 谷歌翻译
社区检测和正交组同步是科学和工程中各种重要应用的基本问题。在这项工作中,我们考虑了社区检测和正交组同步的联合问题,旨在恢复社区并同时执行同步。为此,我们提出了一种简单的算法,该算法由频谱分解步骤组成,然后是彼此枢转的QR分解(CPQR)。所提出的算法与数据点数线性有效且缩放。我们还利用最近开发的“休闲一淘汰”技术来建立近乎最佳保证,以确切地恢复集群成员资格,并稳定地恢复正交变换。数值实验证明了我们算法的效率和功效,并确认了我们的理论表征。
translated by 谷歌翻译
2D断层摄影重建的目标是恢复从各种视图中投影的图像。通常推测,与突起相关联的投影角度预先已知。然而,在某些情况下,这些角度仅仅是近似或完全未知的。从一系列随机投影重建图像变得更具挑战性。我们提出了一种基于对侵犯学习的方法来恢复图像和投影角度分布,通过将测量的经验分布与所生成的数据匹配。通过在发电机和基于Wassersein生成的对抗网络结构之间解决一个MIN-MAX游戏来实现分布。为了通过梯度反向传播容纳投影角度分布的更新,我们使用来自离散分布的样本的Gumbel-Softmax Reparameterization估计损失。我们的理论分析验证了图像的独特恢复和投影分布到收敛时的旋转和反射。我们广泛的数值实验展示了我们在噪声污染下准确恢复图像和投影角度分布的方法的潜力。
translated by 谷歌翻译
仪表不变性在量子力学从冷凝物物理到高能物理中起着至关重要的作用。我们开发了一种构建量子晶格模型构建仪表不变自回归神经网络的方法。这些网络可以有效地采样和明确地遵循仪表对称性。我们为地面状态和各种模型的实时动态进行了各种优化我们的仪表不变自回归神经网络。我们精确地代表了2D和3D转矩代码的地面和激励状态,以及X-Cube Fracton模型。我们模拟$ \ text {u(1)} $格式理论的量子链路模型的动态和Gound状态,获取2d $ \ mathbb {z} _2 $仪表理论的相图,确定相位过渡和$ \文本的中心收费{su(2)} _ 3 $ anyonic链,也计算SU(2)不变的Heisenberg旋转链的地面状态能量。我们的方法提供了强大的工具,可探索凝聚物物理,高能量物理和量子信息科学。
translated by 谷歌翻译
我们介绍了深度学习模型,以估计黑洞兼并的二元组件的群众,$(m_1,m_2)$,以及合并后巧妙剩余滞留的三个天体性质,即最终旋转,$ a_f $,以及ringdown振荡的频率和阻尼时间为基础$ \ ell = m = 2 $酒吧模式,$(\ OMEGA_R,\ OMEGA_I)$。我们的神经网络将修改的$ \ texttt {wavenet} $架构与对比学习和标准化流相结合。我们将这些模型验证在先前分布通过闭合的分析表达描述后的高斯缀合物的先前家庭。确认我们的模型产生统计上一致的结果,我们使用它们来估计五个二进制黑洞的天体物理参数$(m_1,m_2,a_f,\ oomega_r,\ omega_i):$ \ texttt {gw150914},\ texttt {gw170104 },\ texttt {gw170814},\ texttt {gw190521} $和$ \ texttt {gw190630} $。我们使用$ \ texttt {pycbc推理} $直接比较传统的贝叶斯方法进行参数估计与我们的深度学习的后部分布。我们的研究结果表明,我们的神经网络模型预测编码物理相关性的后分布,以及我们的数据驱动的中值结果和90美元\%$置信区间与引力波贝叶斯分析产生的数据相似。此方法需要单个V100 $ \ TextTT {NVIDIA} $ GPU,以在每次事件中生成2毫秒内的中位值和后部分布。这个神经网络和使用的教程,可在$ \ texttt {scounty} $ \ texttt {scounty hub} $。
translated by 谷歌翻译
对自动驾驶车辆的路径跟踪控制可以从深入学习中受益,以应对长期存在的挑战,例如非线性和不确定性。但是,深度神经控制器缺乏安全保证,从而限制了其实际使用。我们提出了一种新的学习方法的新方法,该方法几乎是在神经控制器下为系统设置的正向设置,以定量分析深神经控制器对路径跟踪的安全性。我们设计了基于抽样的学习程序,用于构建候选神经屏障功能,以及利用神经网络的鲁棒性分析的认证程序来确定完全满足屏障条件的区域。我们在学习和认证之间使用对抗性训练循环来优化几乎级词的功能。学习的障碍也可用于通过可及性分析来构建在线安全监视器。我们证明了我们的方法在量化各种模拟环境中神经控制器安全性方面的有效性,从简单的运动学模型到具有高保真车辆动力学模拟的TORCS模拟器。
translated by 谷歌翻译
组织病理组织分类是病理学癌症研究的基本任务。精确区分不同的组织类型是下游研究的好处,如癌症诊断,预后等。现有的作品主要利用计算机视觉中的流行分类骨干,以实现组织病理组织分类。在本文中,我们提出了一种超级轻型即插即用模块,名为金字塔深广阔的学习(PDBL),对于任何训练有素的分类骨架,以进一步提高分类性能而无需重新培训负担。我们模仿病理学家如何观察不同放大率的病理学幻灯片,并为输入图像构造图像金字塔,以获得金字塔内部信息。对于金字塔中的每个级别,我们通过我们提出的深层块(DB-Block)提取多种深度广泛的功能。我们用三个流行的分类骨干网,Shufflenetv2,EppositionNetB0和Reset50配备了PDBL,以评估我们建议模块在两个数据集(Kather Multiclass DataSet和LC25000数据集)上的提出模块的有效性和效率。实验结果表明,所提出的PDBL可以稳定地改善任何CNN骨架的组织级分类性能,特别是对于在训练样本(小于10%)中的小型时,特别是轻量级模型,这极大地节省了计算时间和注释工作。
translated by 谷歌翻译
Compressed videos often exhibit visually annoying artifacts, known as Perceivable Encoding Artifacts (PEAs), which dramatically degrade video visual quality. Subjective and objective measures capable of identifying and quantifying various types of PEAs are critical in improving visual quality. In this paper, we investigate the influence of four spatial PEAs (i.e. blurring, blocking, bleeding, and ringing) and two temporal PEAs (i.e. flickering and floating) on video quality. For spatial artifacts, we propose a visual saliency model with a low computational cost and higher consistency with human visual perception. In terms of temporal artifacts, self-attention based TimeSFormer is improved to detect temporal artifacts. Based on the six types of PEAs, a quality metric called Saliency-Aware Spatio-Temporal Artifacts Measurement (SSTAM) is proposed. Experimental results demonstrate that the proposed method outperforms state-of-the-art metrics. We believe that SSTAM will be beneficial for optimizing video coding techniques.
translated by 谷歌翻译